草庐IT

python - 用重复生成排列

全部标签

Python直接从网址解析xml

嘿。我试图找到一种方法,但我做不到。我已经在python中设置了一个xml.sax解析器,当我读取一个本地文件(例如calendar.xml)时它工作得很好,但我需要从一个网址读取一个xml文件。我想如果我这样做会行得通:toursxml='http://api.songkick.com/api/3.0/artists/mbid:'+mbid+'/calendar.xml?apikey=---------'toursurl=urllib2.urlopen(toursxml)toursurl=toursurl.read()parser.parse(toursurl)但事实并非如此。我确定

python - 从外籍人士的解析错误中优雅地恢复

XML应该是严格的,因此有一些Unicode字符在XML中是不允许的。但是,我正在尝试使用通常包含这些字符的RSS提要,并且我想避免因无效字符造成的解析错误,或者从中优雅地恢复并呈现文档。请在此处查看示例(无论如何在3月21日):http://feeds.feedburner.com/chrisblattman处理XML提要中的unicode的推荐方法是什么?检测字符并替换为空字节、编辑解析器或其他一些方法? 最佳答案 看起来RSS提要包含一个垂直制表符\x0c,这是非法的pertheXML1.0spec.我的建议是在将数据传递给e

python - 使用 lxml 解析 DTD 时出错

我正在尝试编写一个验证脚本来根据NITFDTD验证XML,http://www.iptc.org/std/NITF/3.4/specification/dtd/nitf-3-4.dtd.基于thispost我提出了以下简单脚本来验证NITFXML文档。Bellow是我在运行脚本时收到的错误消息,它不是很具有描述性并且很难调试。感谢您的帮助。#!/usr/bin/envpythondefmain():fromlxmlimportetree,objectifyfromStringIOimportStringIOf=open('nitf_test.xml')xml_doc=f.read()f

sql-server - 从 SQL Server 使用 NodeValues 生成 XML

我正在尝试从SQLServer生成XML,并且需要我选择的字段位于节点值而不是属性中。我当前的SQL是:-SELECTAccountNumberFROMAccountFORXMLAUTO然后生成如下XML:-我希望它显示为:-12345谁能指出我正确的方向? 最佳答案 您还应该查看SQLServer2008和更新版本中可用的FORXMLPATH(...),ROOT(....)结构:MSDNdocs这会让你为一些XML元素指定一个根节点指定XML标签名称将某些位指定为XML属性所以在你的情况下,你可以,例如创建类似的东西:SELECT

javascript - 为同一个 XSL 文件生成两个不同的输出?

这是我的XML文件,如果我运行XSLt文件,我将在EclipseXSL转换中以完全相同的顺序获得相同的输出。即使将新记录添加到我的xml文件并运行XSL文件,将为新记录创建唯一ID。N65539BenFodenAZUSN65539NimalAnupnimal.anup@gmail.comTNIN这是我更新的XSLT文件:N然后我对XUL中的XSLT处理器功能使用了相同的XSLT文件,我得到了不同类型的ID和输出。如果我在XML文件中添加新记录,它会不断为旧记录和新记录生成新ID。如何仅为新记录生成新ID?以及如何将我的输入文件的相同XML模板用于我的XML输出文件。这是我得到的输出:i

java - 使用没有 XSD 模式文件的 XML 文件生成 java 绑定(bind)类?使用任何 Castor 或 JAXB 框架

我需要从XML文件创建java模型类(绑定(bind)类)。不幸的是我没有XSD架构。已有许多XML。奇怪的是,Castor或JAXB都使用XSD架构来生成绑定(bind)模型类。如果您没有模式怎么办?并非所有XML都是使用Schema创建的! 最佳答案 您可以使用架构推理工具,例如Trang.它可以从xml生成xsd。然后您可以调整生成的模式或直接将其提供给JAXB/Castor等。 关于java-使用没有XSD模式文件的XML文件生成java绑定(bind)类?使用任何Castor或

python - 使用带有转义字符作为参数的 XML 使用 WSDL url

我正在执行一个SOAPWeb服务的方法,该方法使用suds库接收3个字符串参数。第一个字符串参数应该是一个XML,另外两个是用户名和密码,这是我的半工作实现。fromsuds.clientimportClienturl="http://www.jonima.com.mx:3014/sefacturapac/TimbradoService?wsdl"client=Client(url)client.service.timbrado(XML_AS_STRING_HERE,'PRUEBA1','12345678')当第一个参数包含转义字符(&符号、引号、撇号、小于、大于)时,方法不起作用,因

sql - 从 SQL Server 中的重复数据填充不同的列表

我需要从一个XML文件中收集不同员工的列表,该文件包含每个员工的销售记录。不幸的是,XML文件中的数据并不完全“一致”。该文件的结构如下:此XML文件被上传到Web应用程序,该应用程序将其内容(作为XML)传递给SQLServer中的存储过程进行处理。由于此文件的大小(最多30,000个元素),我希望尽可能少地在Web应用程序中进行处理。到目前为止,我想到的最佳解决方案是为每个不同的EmployeeId和ManagerId值创建一个包含一行的临时表。然后,对于表中的每一行,循环遍历具有匹配EmployeeId的XML元素,直到找到名称不为空的条目(然后对ManagerId重复)。因此,

xml - 使用 XSLT 删除连续的重复项

我有一些XML,我想在其中删除相同的连续子节点,这些子节点位于不同的父节点中。也就是说,如果一个子节点(在不同的父节点中)我的XML树连续出现两次或更多次,我想删除所有重复项。我想到的重复节点是a在前两个节点。一个例子:这是源XML:abcabbccaaabbbcccabbbbcccc这是所需的XML:abcbbccaaabbbcccabbbbcccc只删除一个元素,但如果有,例如,连续5个a开头的节点(而不是2个),其中四个将被删除。我正在使用XSLT2.0。我很感激任何帮助。跟进:感谢Kirill,我得到了我想要的文档,但是如果我有这样的XML文档,这会产生一个我没有预料到的新问题

python - 下载没有 Python unicode 错误的 html

我正在尝试将page_source下载到文件中。但是,每次我得到:UnicodeDecodeError:'ascii'codeccan'tdecodebyte0xc2(orsomethingelse)inposition8304:ordinalnotinrange(128)我试过使用value.encode('utf-8'),但似乎每次它都会抛出相同的异常(除了手动尝试替换每个非ascii字符之外).有没有办法“预处理”html以将其转换为“可写”格式? 最佳答案 有第三方库如BeautifulSoup和lxml可以自动处理编码问题